1 Setup

Wykorzystane biblioteki:

  • knitr,
  • dplyr,
  • EDAWR
  • skimr,
  • DT.
library(knitr)
library(dplyr)
library(EDAWR)
library(skimr)
library(DT)

2 Wykorzystane dane

Wykorzystany zbiór danych posiada 3800 rekordów zawierających informacje o liczbie zachorowań na gruźlicę w poszczególnych krajach w latach 1995-2013.

Atrybuty w zbiorze danych:

  • “country” - kraj,
  • “year” - rok,
  • “sex” - płeć,
  • “child” - liczba przypadków odnotowanych wśród osób w wieku 0-14 lat,
  • “adult” - liczba przypadków odnotowanych wśród osób w wieku 15-64 lata,
  • “elderly” - liczba przypadków odnotowanych wśród osób w wieku powyżej 64 lat.
Data summary
Name data_tb
Number of rows 3800
Number of columns 6
_______________________
Column type frequency:
character 2
numeric 4
________________________
Group variables None

Variable type: character

skim_variable n_missing complete_rate min max empty n_unique whitespace
country 0 1 4 52 0 100 0
sex 0 1 4 6 0 2 0

Variable type: numeric

skim_variable n_missing complete_rate mean sd p0 p25 p50 p75 p100 hist
year 0 1.00 2004.00 5.48 1995 1999.0 2004 2009.0 2013 ▇▇▆▇▇
child 396 0.90 493.22 1932.01 0 25.0 76 264.5 25661 ▇▁▁▁▁
adult 413 0.89 10863.88 37024.18 0 1128.5 2589 6705.5 731540 ▇▁▁▁▁
elderly 413 0.89 1253.05 6179.52 0 84.5 230 640.0 125991 ▇▁▁▁▁

3 Analiza liczby zachorowań z podziałem na płeć

sex total_counts
female 15656162
male 27062807

4 Sumaryczna liczba zachorowań wśród różnych grup wiekowych na przestrzeni lat

5 Sumaryczna liczba zachorowań wśród różnych grup wiekowych na przestrzeni lat osobno dla każdego kraju